Text copied to clipboard!

Titel

Text copied to clipboard!

Site Reliability Engineer (SRE)

Beskrivelse

Text copied to clipboard!
Vi leder efter en erfaren og engageret Sitepålidelighedsingeniør til at styrke vores tekniske team og sikre høj tilgængelighed, ydeevne og skalerbarhed af vores produktionssystemer. Som Sitepålidelighedsingeniør (SRE) vil du spille en central rolle i at bygge og vedligeholde robuste infrastrukturer, automatisere processer og sikre, at vores tjenester kører problemfrit og effektivt. Du vil arbejde tæt sammen med udviklingsteams, drift og sikkerhed for at implementere bedste praksis inden for DevOps og SRE. Dit arbejde vil bidrage til at minimere nedetid, forbedre systemovervågning og sikre hurtig respons på hændelser. Du vil også være ansvarlig for at designe og implementere løsninger, der understøtter kontinuerlig integration og levering (CI/CD), samt sikre, at vores systemer er skalerbare og modstandsdygtige over for fejl. Vi forventer, at du har en stærk teknisk baggrund, erfaring med cloud-platforme som AWS, Azure eller Google Cloud, og at du er fortrolig med containerteknologier som Docker og Kubernetes. Du skal kunne analysere komplekse systemproblemer, identificere flaskehalse og implementere løsninger, der forbedrer systemets pålidelighed og ydeevne. Som en del af vores team vil du også deltage i vagtordninger og være med til at håndtere kritiske hændelser, samt bidrage til løbende forbedringer af vores overvågnings- og alarmeringssystemer. Du vil være med til at definere og måle SLO'er og SLA'er, og sikre, at vores tjenester lever op til de aftalte standarder. Hvis du brænder for automatisering, systemoptimering og driftssikkerhed, og ønsker at arbejde i et dynamisk og innovativt miljø, så er dette jobbet for dig.

Ansvarsområder

Text copied to clipboard!
  • Overvåge og sikre systempålidelighed og ydeevne
  • Automatisere driftsopgaver og processer
  • Implementere og vedligeholde CI/CD pipelines
  • Samarbejde med udviklingsteams om systemdesign og skalerbarhed
  • Håndtere og analysere hændelser og fejl
  • Forbedre overvågnings- og alarmeringssystemer
  • Definere og måle SLO'er og SLA'er
  • Optimere systemarkitektur for høj tilgængelighed
  • Deltage i vagtordninger og beredskab
  • Dokumentere systemer og processer

Krav

Text copied to clipboard!
  • Erfaring som Sitepålidelighedsingeniør eller lignende rolle
  • Stærk viden om Linux/Unix-systemer
  • Erfaring med cloud-platforme (AWS, Azure, GCP)
  • Kendskab til containerteknologier som Docker og Kubernetes
  • Erfaring med overvågningsværktøjer (Prometheus, Grafana, etc.)
  • Kendskab til scripting og automatisering (Bash, Python, etc.)
  • Forståelse for netværk og sikkerhed
  • Erfaring med CI/CD værktøjer (Jenkins, GitLab CI, etc.)
  • Evne til at arbejde i tværfunktionelle teams
  • Gode kommunikationsevner på dansk og engelsk

Mulige interviewspørgsmål

Text copied to clipboard!
  • Hvilken erfaring har du med cloud-infrastruktur?
  • Hvordan har du tidligere arbejdet med automatisering?
  • Hvilke overvågningsværktøjer har du erfaring med?
  • Hvordan håndterer du kritiske systemhændelser?
  • Har du erfaring med containerteknologier som Kubernetes?
  • Hvordan sikrer du høj tilgængelighed i systemdesign?
  • Hvilke scripting-sprog er du mest fortrolig med?
  • Hvordan arbejder du sammen med udviklingsteams?
  • Har du erfaring med CI/CD pipelines?
  • Hvordan måler og forbedrer du systempålidelighed?